ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب

Authors

Abstract:

جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می‌گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده‌ بندی مبتنی بر خصیصه (Attribute-based Classification) و همچنین تعبیه برچسب (Label Embedding) است. در این مقاله چند خصیصه مختلف مبتنی بر ساختار نگارش زبان فارسی جهت استفاده در بازیابی کلمات تصویری فارسی معرفی شده و نتایج حاصل از روش های مبتنی بر خصیصه ‌های پیشنهادی مقایسه گردیده است. در ارائه خصیصه ‌ها ساختار نگارشی زبان فارسی درنظر گرفته شده است تا بهترین مطابقت را با روش نگارش فارسی داشته باشد. روش مورد مطالعه توانایی بازیابی کلمات تصویری با استفاده از کلمه پرسشی تصویری و متنی را داراست. علاوه بر این می‌تواند به عنوان روشی جهت بازشناسی کلمات نیز مورد استفاده قرار گیرد. همچنین روش ارائه شده با استفاده از قابلیت رده‌ بندی مبتنی بر خصیصه، توانایی شناسایی کلاس کلماتی که در پایگاه داده آموزشی وجود ندارد را نیز دارا است. آزمایش‌های تجربی بر روی دو مجموعه داده استاندارد فارسا و ایرانشهر مورد بررسی قرار گرفته و نتایج حاصل از اجرای روش پیشنهادی قابل قبول است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

مدل‌سازی بازشناسی واجی کلمات فارسی

Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...

full text

ساخت موضوعی کلمات مشتق در زبان فارسی

ساخت موضوعـی بـه فهرست موضوع‌هـای یک محمـول اطلاق می‌شود. مثلاً، فعل «خورد» دو موضوع و فعل «داد» سه موضوع در ساخت موضوعی خود دارد. معمولاً ساخت موضوعی افعال پس از افزوده‌شدن یک وند اشتقاقی به آنها تغییر می‌کند، به‌گونه‌ای که ساخت موضوعی مشتق حاصله با ساخت موضوعی کلمۀ پایه متفاوت است. در مقالة حاضر، ساخت موضوعی مشتقات فعلی زبان فارسی و تأثیر وند افزایی بر ساخت موضوعی کلمة پایه را مطالعه می‌کنیم. چ...

full text

بررسی مقابله‌ای کلمات اندازه گیری زبان فارسی با زبان کردی (گویش سورانی و کردی کلهری) با رویکرد آموزش زبان فارسی به غیر فارسی زبانان

اهمیت و جایگاه زبان­شناسی مقابله‌ای در بررسی تفاوت‌ها و شباهت‌ها میان دو یا بیشتر از دو زبان، به­ویژه مقایسۀ زبان فارسی با زبان­های دیگر،  نیازمند برنامه­ریزی و انجام تحقیقات بیشتری است. امروزه، در این زمینه، کارهای زیادی در حوزه­های مختلفِ:  دستور، آواشناسی، گفتمان، واژگان و حتی بررسی مقابله­ای دو متن از دو زبان، به انجام رسیده­است. درپژوهش حاضر که در زمینۀ واژگان است سعی شده اسم­های اندازه­گیر...

full text

سیستم برچسب گذاری اجزای واژگانی کلام در زبان فارسی

Abstract: Part-Of-Speech (POS) tagging is essential work for many models and methods in other areas in natural language processing such as machine translation, spell checker, text-to-speech, automatic speech recognition, etc. So far, high accurate POS taggers have been created in many languages. In this paper, we focus on POS tagging in the Persian language. Because of problems in Persian POS t...

full text

بازشناسی علامت‌های ساکن زبان اشاره‌ی فارسی با استفاده از یک توصیف‌گر شکلی جدید

در این مقاله یک سیستم برای بازشناسی علامت‌های ساکن زبان اشاره‌ی فارسی پیشنهاد شده است. این سیستم بر مبنای یک ویژگی شکلی جدید طراحی شده و قادر است با نرخ تشخیص بالایی، علامت‌های ساکن الفبای زبان اشاره‌ی فارسی را به طور خودکار بازشناسی کند. در اینسیستم، ابتدا با استفاده از آنالیز مؤلفه‌ی اصلی (PCA)، جهت‌های غالب دست را بدست می‌آوریم و تصاویر را در جهت غالب دست، به نحوی که سیستم مختصات جدید تصویر ...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 3  issue 1

pages  45- 54

publication date 2016-05-21

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023